package com.grep.extra.service;

import com.grep.extra.factory.data.impl.Content;
import com.grep.extra.factory.data.impl.PageContent;
import com.grep.extra.factory.data.impl.SiteUrl;
import com.grep.extra.factory.data.impl.TaskContentUrl;
import com.grep.extra.factory.data.impl.TaskUrl;
import com.grep.extra.factory.handle.IHandler;

/**
 * @author yuyue z_yuguangyue@boco.com.cn
 * 
 * version <br>
 * Copyright (C) 2009-2010 bocosoft <br>
 *           This program is protected by copyright laws. <br>
 *           Program Name:UMS Second Period (UMS二期).
 * <br>
 *
 * Description: .
 *   程序总体调度接口，负责程序生命周期
 *
 * CreateTime: Jan 5, 2012  2:46:45 PM
 *
 * Change History:
 *
 *        Date             CR Number              Name              Description of change
 *
 *
 */
public interface CollectTask {
	
	public void discoveryTaskUrl(
			IHandler<SiteUrl, TaskUrl> handler) ;
	/**
	 * 传入要采集的URL集合，传入对这个集合解析的方法，返回采集的所有的内容的url集合
	 * @param handler	加工处理的接口
	 */
	public void discoveryTaskContentUrl(
			IHandler<TaskUrl,TaskContentUrl> handler) ;
	
	/**
	 * 传入采集内容的URL集合，以及站点信息，方法将这些url进行入库处理
	 * @param handler	加工处理的接口
	 */
	public void discoveryPageContent(
			IHandler<TaskContentUrl,PageContent> handler) ;
	
	/**
	 * 处理本地内容文件 提取页面的字段 最后入库
	 * @param handler	加工处理的接口
	 */
	public void discoveryContent(
			IHandler<PageContent,Content> handler) ;
	

}
